#Datensatz einlesen
df_original <- read.csv("https://swissvotes.ch/page/dataset/swissvotes_dataset.csv", header=TRUE, sep=";", na = c("NA", "."))
#Datensatz anschauen
head(df_original)
str(df_original)
'data.frame':   676 obs. of  834 variables:
 $ anr                : num  1 2 3 4 5 6 7 8 9 10 ...
 $ datum              : chr  "12.09.1848" "14.01.1866" "14.01.1866" "14.01.1866" ...
 $ titel_kurz_d       : chr  "Bundesverfassung der schweizerischen Eidgenossenschaft" "Mass und Gewicht" "Gleichstellung der Juden und Naturalisierten mit Bezug auf Niederlassung" "Stimmrecht der Niedergelassenen in Gemeindeangelegenheiten" ...
 $ titel_kurz_f       : chr  "Constitution f\xe9d\xe9rale de la Conf\xe9d\xe9ration suisse" "Poids et mesures" "Egalit\xe9 des Juifs" "Droit de vote des Suisses \xe9tablis, en mati\xe8re communale" ...
 $ titel_off_d        : chr  "Totalrevision vom 12. September 1848" "Festsetzung von Mass und Gewicht" "Gleichstellung der Juden und Naturalisierten mit Bezug auf Niederlassung" "Stimmrecht der Niedergelassenen in Gemeindeangelegenheiten" ...
 $ titel_off_f        : chr  "R\xe9vision totale du 12 septembre 1848" "Poids et mesures" "Egalit\xe9 des citoyens au point de vue de l'\xe9tablissement et de la l\xe9gislation" "Droit de vote des Suisses \xe9tablis, en mati\xe8re communale" ...
 $ stichwort          : chr  NA NA NA NA ...
 $ swissvoteslink     : chr  "https://swissvotes.ch/vote/1.00" "https://swissvotes.ch/vote/2.00" "https://swissvotes.ch/vote/3.00" "https://swissvotes.ch/vote/4.00" ...
 $ anzahl             : int  1 9 9 9 9 9 9 9 9 9 ...
 $ rechtsform         : int  1 1 1 1 1 1 1 1 1 1 ...
 $ kurzbetitel        : chr  "Die Gr\xfcndung des schweizerischen Bundesstaates 1848" "Wegen des St\xe4ndemehrs: Ein 'Schoppen' bleibt ein 'Schoppen'" "Das einzige Ja von 1866: Freie Niederlassung f\xfcr Juden" "Kantonsfremde Niedergelassene bleiben benachteiligt" ...
 $ anneepolitique     : chr  "" "" "" "" ...
 $ bkchrono.de        : chr  "" "" "" "" ...
 $ bkchrono.fr        : chr  "" "" "" "" ...
 $ d1e1               : int  1 1 12 1 6 1 12 1 4 4 ...
 $ d1e2               : num  1.2 1.5 12.3 1.4 6.1 1.4 12.3 1.6 4.1 4.1 ...
 $ d1e3               : num  1.21 1.52 NA 1.43 6.12 1.43 NA 1.65 4.12 4.13 ...
 $ d2e1               : int  1 NA 1 1 1 1 1 1 12 4 ...
 $ d2e2               : num  1.5 NA 1.6 1.6 1.6 1.6 1.6 1.5 12.1 4.4 ...
 $ d2e3               : num  1.52 NA 1.62 1.62 1.62 1.62 1.62 1.52 NA 4.43 ...
 $ d3e1               : int  NA NA 1 1 1 1 NA 1 1 NA ...
 $ d3e2               : num  NA NA 1.5 1.5 1.5 1.5 NA 1.6 1.5 NA ...
 $ d3e3               : num  NA NA 1.52 1.52 1.52 1.52 NA 1.62 1.52 NA ...
 $ dep                : int  NA NA 3 NA NA NA NA NA NA NA ...
 $ br.pos             : int  3 NA NA NA NA NA NA NA NA NA ...
 $ legislatur         : int  1 6 6 6 6 6 6 6 6 6 ...
 $ legisjahr          : chr  "1848-1851" "1863-1866" "1863-1866" "1863-1866" ...
 $ gesch_nr           : chr  NA NA NA NA ...
 $ curiavista.de      : chr  "" "" "" "" ...
 $ curiavista.fr      : chr  "" "" "" "" ...
 $ bv.pos             : int  3 1 1 1 1 1 1 1 1 1 ...
 $ nr.pos             : int  3 1 1 1 1 1 1 1 1 1 ...
 $ nrja               : int  NA NA NA NA NA NA NA NA NA NA ...
 $ nrnein             : int  NA NA NA NA NA NA NA NA NA NA ...
 $ sr.pos             : int  3 1 1 1 1 1 1 1 1 1 ...
 $ srja               : int  NA NA NA NA NA NA NA NA NA NA ...
 $ srnein             : int  NA NA NA NA NA NA NA NA NA NA ...
 $ dat.preexam        : chr  "0" "0" "0" "0" ...
 $ dat.start          : chr  "0" "0" "0" "0" ...
 $ dat.limit          : chr  "00.01.1900" "00.01.1900" "00.01.1900" "00.01.1900" ...
 $ sammelfrist        : int  0 0 0 0 0 0 0 0 0 0 ...
 $ unter.quorum       : int  0 0 0 0 0 0 0 0 0 0 ...
 $ dat.submit         : chr  "0" "0" "0" "0" ...
 $ dat.success        : chr  "0" "0" "0" "0" ...
 $ dat.message        : chr  NA "01.07.1865" "01.07.1865" "01.07.1865" ...
 $ dat.parl           : chr  NA "19.11.1865" "19.11.1865" "19.11.1865" ...
 $ dat.force          : chr  NA "0" NA "0" ...
 $ dauer_bv           : int  NA NA NA NA NA NA NA NA NA NA ...
 $ dauer_abst         : int  NA NA NA NA NA NA NA NA NA NA ...
 $ i.dauer_tot        : int  NA NA NA NA NA NA NA NA NA NA ...
 $ i.dauer_samm       : int  NA NA NA NA NA NA NA NA NA NA ...
 $ i.dauer_br         : int  NA NA NA NA NA NA NA NA NA NA ...
 $ fr.dauer_samm      : int  NA NA NA NA NA NA NA NA NA NA ...
 $ fr.dauer_tot       : int  NA NA NA NA NA NA NA NA NA NA ...
 $ unter_g            : int  NA NA NA NA NA NA NA NA NA NA ...
 $ unter_u            : int  NA NA NA NA NA NA NA NA NA NA ...
 $ urheber            : chr  NA NA NA NA ...
 $ info_br.de         : chr  "" "" "" "" ...
 $ info_br.fr         : chr  "" "" "" "" ...
 $ info_br.en         : chr  "" "" "" "" ...
 $ info_dep.de        : chr  "" "" "" "" ...
 $ info_dep.fr        : chr  "" "" "" "" ...
 $ info_dep.en        : chr  "" "" "" "" ...
 $ info_amt.de        : chr  "" "" "" "" ...
 $ info_amt.fr        : chr  "" "" "" "" ...
 $ info_amt.en        : chr  "" "" "" "" ...
 $ p.fdp              : int  9999 9999 9999 9999 9999 9999 9999 9999 9999 9999 ...
 $ p.sps              : int  9999 9999 9999 9999 9999 9999 9999 9999 9999 9999 ...
 $ p.svp              : int  9999 9999 9999 9999 9999 9999 9999 9999 9999 9999 ...
 $ p.mitte            : int  9999 9999 9999 9999 9999 9999 9999 9999 9999 9999 ...
 $ p.evp              : int  9999 9999 9999 9999 9999 9999 9999 9999 9999 9999 ...
 $ p.gps              : int  9999 9999 9999 9999 9999 9999 9999 9999 9999 9999 ...
 $ p.glp              : int  9999 9999 9999 9999 9999 9999 9999 9999 9999 9999 ...
 $ p.ucsp             : int  9999 9999 9999 9999 9999 9999 9999 9999 9999 9999 ...
 $ p.pda              : int  9999 9999 9999 9999 9999 9999 9999 9999 9999 9999 ...
 $ p.sd               : int  9999 9999 9999 9999 9999 9999 9999 9999 9999 9999 ...
 $ p.edu              : int  9999 9999 9999 9999 9999 9999 9999 9999 9999 9999 ...
 $ p.fps              : int  9999 9999 9999 9999 9999 9999 9999 9999 9999 9999 ...
 $ p.lega             : int  9999 9999 9999 9999 9999 9999 9999 9999 9999 9999 ...
 $ p.kvp              : int  9999 9999 9999 9999 9999 9999 9999 9999 9999 9999 ...
 $ p.mcg              : int  9999 9999 9999 9999 9999 9999 9999 9999 9999 9999 ...
 $ p.cvp              : int  9999 9999 9999 9999 9999 9999 9999 9999 9999 9999 ...
 $ p.bdp              : int  9999 9999 9999 9999 9999 9999 9999 9999 9999 9999 ...
 $ p.lps              : int  9999 9999 9999 9999 9999 9999 9999 9999 9999 9999 ...
 $ p.ldu              : int  9999 9999 9999 9999 9999 9999 9999 9999 9999 9999 ...
 $ p.poch             : int  9999 9999 9999 9999 9999 9999 9999 9999 9999 9999 ...
 $ p.rep              : int  9999 9999 9999 9999 9999 9999 9999 9999 9999 9999 ...
 $ p.eco              : int  9999 9999 9999 9999 9999 9999 9999 9999 9999 9999 ...
 $ p.sgv              : int  9999 9999 9999 9999 9999 9999 9999 9999 9999 9999 ...
 $ p.sbv              : int  9999 9999 9999 9999 9999 9999 9999 9999 9999 9999 ...
 $ p.sgb              : int  9999 9999 9999 9999 9999 9999 9999 9999 9999 9999 ...
 $ p.travs            : int  9999 9999 9999 9999 9999 9999 9999 9999 9999 9999 ...
 $ p.sav              : int  9999 9999 9999 9999 9999 9999 9999 9999 9999 9999 ...
 $ p.vsa              : int  9999 9999 9999 9999 9999 9999 9999 9999 9999 9999 ...
 $ p.vpod             : int  NA NA NA NA NA NA NA NA NA NA ...
 $ p.voev             : int  NA NA NA NA NA NA NA NA NA NA ...
 $ p.tcs              : int  NA NA NA NA NA NA NA NA NA NA ...
 $ p.vcs              : int  NA NA NA NA NA NA NA NA NA NA ...
 $ p.acs              : int  NA NA NA NA NA NA NA NA NA NA ...
  [list output truncated]
#Variablen definieren um nachher mehrere Spalten gleichzeitig zu mutieren

positionen  <- df_original %>%
  select(ends_with(".pos")|starts_with("p.")|starts_with("pdev")) 

hauptthema <- df_original %>%
  select(d1e1, d2e1 ,d3e1)

unterthema <- df_original %>%
  select(d1e2, d2e2 ,d3e2)

unterunterthema <- df_original %>%
  select(d1e3, d2e3 ,d3e3)

daten <- df_original%>%
  select(datum, starts_with("dat."))

resultate <- df_original %>%
  select(ends_with("annahme")| volk | stand)

parteien <- c(".svp", ".fdp", ".sp", ".cvp", ".gsp", ".sps")
#Data-Wrangling (Variablen codieren)
data <- df_original %>%
  # filter((d1e2 > 2 & d1e2 < 4 | (d1e3 > 10.30 & d1e3 < 10.33)) |
  #        (d2e2 > 2 & d2e2 < 4 | (d2e3 > 10.30 & d2e3 < 10.33))|
  #        (d3e2 > 2 & d3e2 < 4 | (d3e3 > 10.30 & d3e3 < 10.33)) ) %>% #Filter der Themengebiete
  select(-(ends_with(".fr")|ends_with("_f")|ends_with(".en")))%>% #Entfernung französische Übersetzungen
  rename(Kurztitel = titel_kurz_d, Titel = titel_off_d, ) %>% 

    mutate(rechtsform = factor(case_when(
    rechtsform == 1 ~ "Obligatorisches Referendum",
    rechtsform == 2 ~ "Fakultatives Referendum",
    rechtsform == 3 ~ "Volksinitiative",
    rechtsform == 4 ~ "Gegenentwurf zu Volksinitiative",
    rechtsform == 5 ~ "Stichfrage")))%>% 
  
    mutate(dep = factor(case_when(
    dep == 1 ~ "EDA",
    dep == 2 ~ "EDI",
    dep == 3 ~ "EJPD",
    dep == 4 ~ "VBS",
    dep == 5 ~ "EFD",
    dep == 6 ~ "WBF",
    dep == 7 ~ "UVEK",
    dep == 8 ~ "BK")))%>%
  mutate (Jahr = as.integer(format(as.Date(datum, format='%d.%m.%Y'), format="%Y"))) %>% 
  
  mutate(across(names(positionen), 
           ~ factor(case_when(. == 1 ~ "Befürwortend",
    .== 2 ~"Ablehnend",
    .== 3 ~"Keine",
    .== 4 ~"Leere Abgabe",
    .== 5 ~"Stimmfreigabe",
    .== 8 ~"Vorzug für den Gegenentwurf",
    .== 9 ~"Vorzug für Volksinitiative",
    . == 66 ~"keine",
    . == 9999 ~"Partei ex. nicht",)))) %>%
  
  mutate(across(names(hauptthema), 
             ~ factor(case_when(. == 1 ~ "Staatsordnung",
    .== 2 ~ "Aussenpolitik",
    .== 3 ~"Sicherheitspolitik",
    .== 4 ~"Wirtschaft",
    .== 5 ~"Landwirtschaft",
    .== 6 ~"Öffentliche Finanzen",
    .== 7 ~"Energie",
    .== 8 ~"Verkehr und Infrastruktur",
    .== 9 ~"Umwelt und Lebensraum",
    .== 10 ~"Sozialpolitik",
    .== 11 ~"Bildung und Forschung",
    .== 12 ~"Kultur, Religion, Medien",))))%>%
  
  mutate(across(names(unterthema), 
             ~ factor(case_when(. == 2.1 ~ "Aussenpolitische Grundhaltung",
    .== 2.2 ~ "Europapolitik",
    .== 2.3 ~ "Internationale Organisationen",
    .== 2.4 ~ "Entwicklungszusammenarbeit",
    .== 2.5 ~ "Staatsverträge mit einzelnen Staaten",
    .== 2.6 ~"Aussenwirtschaftspolitik",
    .== 2.7 ~"Diplomatie",
    .== 2.8 ~"Auslandschweizer:innen",
    .== 3.1 ~"Öffentliche Sicherheit",
    .== 3.2 ~"Armee",
    .== 3.3 ~"Landesversorgung",
    .== 10.3 ~"Ausländer & Flüchtlinge", 
    TRUE ~"andere")))) %>%
  mutate(across(names(unterunterthema), 
             ~ factor(case_when(. == 10.31 ~ "Ausländerpolitik",
    .== 10.32 ~ "Flüchtlinge",
     TRUE ~"andere")))) %>%
  
  #mutate(across(names(daten), 
  #              ~ as.Date(., "%d.%m.%Y"))) %>%
  
  mutate(across(names(resultate), 
                ~ factor(case_when(. == 0 ~"abgelehnt", 
                .== 1 ~ "angenommen", 
                .== 3 ~ "Ständemehr nicht nötig", 
                .== 8 ~ "Gegenentwurf angenommen", 
                .== 9 ~ "Volksinitiative angenommen" )))) %>% 
  mutate(anr = as.factor(anr)) 
  

  
#Neue Variablen generieren & Datensatz selektieren

data$bet_volkja.proz <- (data$bet*(data$volkja.proz/100))

df <- data %>%
  select(anr,Jahr, Kurztitel, rechtsform, annahme, bet_volkja.proz, bet,  d1e1:br.pos, bv.pos:nr.pos, sr.pos, unter_g, unter_u, ends_with(parteien), ja.lager, nein.lager, volk:stand, volkja.proz, ktjaproz,matches("...bet"),matches("...japroz"), matches("...annahme"),swissvoteslink, anneepolitique, info_br.de, info_dep.de, info_amt.de)


#neue Variablen: prüfen, ob Thema vorkommt und wenn ja, trägt es 1 ein (sonst 0)
df$Sicherheitspolitik <- +(rowSums(df[2:12] == 'Sicherheitspolitik', na.rm = TRUE) > 0)
df$Aussenpolitik <- +(rowSums(df[2:12] == 'Aussenpolitik', na.rm = TRUE) > 0)
df$Ausländer <- +(rowSums(df[2:12] == 'Ausländerpolitik', na.rm = TRUE) > 0)
df$Flüchtlinge <- +(rowSums(df[2:12] == 'Flüchtlinge', na.rm = TRUE) > 0)

#neue Spalte: fasst Themen der neuen Spalten zusammen, alles andere wird als "anderes" kategorisiert. 
df <- df %>% 
    mutate(Thema = factor(case_when(
    Sicherheitspolitik == 1 ~ "Sicherheitspolitik",
    Aussenpolitik == 1 ~ "Aussenpolitik",
    Flüchtlinge == 1 ~ "Flüchtlinge",
    Ausländer == 1 ~ "Ausländer",
    TRUE ~"andere"))) %>% 
    mutate(Jahrzehnt = as.factor(floor(Jahr/10)*10)) %>% 
    mutate(relevant = ifelse(Thema == "andere", "nein", "ja")) 
ausländer <- df %>% 
  filter(Thema %in% c("Ausländer", "Flüchtlinge")) %>%
  filter(rechtsform != "Stichfrage") %>% 
  mutate (Faktor = c(0, 0, 0, 0, 0, 0, 0, -100, -100, 0, 0, 0, -100, 0, 0, 0, 0, 0, 0,  0, 0, 0, 0, 0, -100 )) %>% 
  mutate(volkja.proz = abs(volkja.proz+Faktor))


#x <- ausländer %>% 
#  select(ends_with("proz")) %>% 
 # mutate(lapply(., ~ .+Faktor))
  
#lapply(x, +ausländer$Faktor)
#x

#Durchschnitt allg. Schweiz bei Abstimmungen vs. Abstimmungen über Ausländer
mean(df$bet, na.rm = TRUE)
mean(ausländer$bet)





kantone_bet <- ausländer %>%
  select(ends_with(".bet")) %>% 
  summarize(mean = colMeans(., na.rm = TRUE))

kantone_japroz <- ausländer %>% 
  select(ends_with(".japroz"))

Liste_kantone <- list(names(colMeans(ausländer[39:64])))
svp_ja <- ausländer %>% 
  filter(p.svp == "Befürwortend") %>% 
  summarize(Durchschnitt = colMeans(ausländer[39:64], na.rm = TRUE))



svp_nein <- ausländer %>% 
  filter(p.svp == "Ablehnend") %>% 
  summarise_at(c(names(kantone_japroz)), mean, na.rm = TRUE)


svp_total <- ausländer %>% 
  group_by(p.svp) %>% 
  summarise_at(c(names(kantone_japroz)), mean, na.rm = TRUE)


ggplot(svp_total, aes(p.svp, zh.japroz))+
  geom_jitter()

SVP_kt <- cbind(argh = Liste_kantone, svp_ja, svp_nein) 

colnames(SVP_kt)[1] <- "Kanton"


mean(df$volkja.proz, na.rm = TRUE)

annahmen_ausländer <- ausländer %>% 
  group_by(rechtsform) %>% 
  summarize(mean = mean(volkja.proz, na.rm = TRUE))
mean(ausländer$volkja.proz)


parteien_japroz <- ausländer %>% 
  group_by(p.svp, p.fdp, p.sps, p.cvp) %>% 
  summarize(jastimmen = mean(volkja.proz))
  
ggplot(ausländer, aes(Jahr)) + 
  geom_histogram(binwidth = 5)




ausländer[39:61]


#colMeans(ausländer["zh.bet":"ge.bet"], na.rm = TRUE)
ggplot(ausländer, aes(Jahrzehnt, fill = Thema)) + 
  geom_bar()

flüchtling <- df %>% 
  filter(Thema == "Flüchtlinge") 


#Stimmbeteiligung Kantone im Vergleich für Abstimmungen
ggplot(ausländer, aes(anr, bet, fill= annahme))+
  geom_col()

#glimpse(df)
#eingeschränkter Datensatz für Visualisierung
df_vis <- df %>% 
  select(anr, Jahr, Kurztitel, rechtsform, br.pos, Sicherheitspolitik:relevant) 
#Anzahl Abstimmungen, gruppiert nach Jahrzehnt & Thema, nebeneinander
df_vis %>% 
  group_by(Jahrzehnt, Thema) %>% 
  count() %>% 
  ggplot(aes(Jahrzehnt, n, fill = Thema)) +
  geom_bar(position="dodge", stat="identity") +
  scale_fill_brewer(palette="Spectral")


#Anzahl Abstimmungen, gruppiert nach Jahrzehnt & Thema, stacked
df_vis %>% 
  group_by(Jahrzehnt, relevant, Thema) %>% 
  count() %>% 
  ggplot(aes(Jahrzehnt, n, fill = Thema)) +
  geom_bar(position="stack", stat="identity") +
  scale_fill_brewer(palette="Spectral") +
  labs(title = "Anzahl Abstimmungen pro Jahrzehnt", subtitle =  "Gruppiert nach Themen unseres Beitrages & Rest", y = "Anzahl")





df_vis %>% 
  filter(Thema == "Ausländer"|Thema == "Flüchtlinge") %>% 
  group_by(Jahrzehnt, relevant, Thema) %>% 
  count() %>% 
  ggplot(aes(Jahrzehnt, n, fill = Thema)) +
  geom_bar(position="dodge", stat="identity") +
  scale_fill_brewer(palette="Spectral") +
  labs(title = "Anzahl Abstimmungen pro Jahrzehnt", subtitle =  "Gruppiert nach Themen unseres Beitrages & Rest", y = "Anzahl")



df %>% 
  filter(Thema == "Ausländer"|Thema == "Flüchtlinge") %>% 
  group_by(Jahrzehnt, Thema, annahme) %>% 
  count() %>% 
  ggplot(aes(Jahrzehnt, n, fill = annahme)) +
  geom_bar(position="stack", stat="identity") +
  #scale_fill_brewer(palette="Spectral") +
  labs(title = "Anzahl Abstimmungen zu Flüchtlinge / Ausländer", subtitle =  "Angenommene & abgelehnte", y = "Anzahl")

#Abstimmungen, gruppiert nach Rechtsform & Jahrzehnt
df %>% 
  filter(relevant == "ja") %>% 
  group_by(Jahrzehnt, rechtsform, Thema,annahme) %>% 
  count() %>% 
  ggplot(aes(Jahrzehnt, rechtsform, color = annahme)) +
  geom_jitter() +
  #scale_color_brewer(palette="Spectral") +
  facet_wrap(~Thema)

#Anzahl Abstimmungen pro Jahrzehnt in Zahlen (nur relevante Themen)
df %>% 
  filter(Jahr > 1910, relevant == "ja") %>% 
  group_by(Jahrzehnt, Thema) %>% 
  count()

#Anzahl Abstimmungen pro Rechtsform + Position Bundesrat in Zahlen (nur relevante Themen)
df_vis %>% 
  filter(Jahr > 1910, relevant == "ja") %>% 
  group_by(rechtsform, Thema, br.pos) %>% 
  count()


ausländer <- df %>% 
  filter(Thema == "Ausländer")

flucht <- df %>% 
  filter(Thema == "Flüchtlinge")

  

positionen_br <- ggplot(df, aes( Jahr,rechtsform, color = br.pos )) + geom_jitter() + scale_color_brewer(palette="Spectral") 

positionen_br


ggplot(df, aes(Jahr, br.pos, color = Thema, shape = rechtsform)) +
  geom_jitter(alpha = 0.7) +
  scale_color_brewer(palette="Spectral") 

  #scale_y_discrete(breaks = seq(1820, 2022, 10))

  df %>% 
  filter(relevant == "ja") %>% 
  ggplot(aes(br.pos, Thema, color = rechtsform), na.rm = TRUE) +
  geom_jitter(alpha = 0.7)   +
  scale_color_brewer(palette="Spectral") 

  #scale_y_discrete(breaks = seq(1820, 2022, 10))
  
  
  df %>% 
  filter(relevant == "ja") %>% 
  ggplot(aes(Thema, rechtsform, color = br.pos)) +
  geom_jitter() 

  #scale_color_brewer(palette="Spectral") 
  #scale_y_discrete(breaks = seq(1820, 2022, 10))
  
  
  df %>% 
  filter(relevant == "ja") %>% 
  ggplot(aes(Jahr, br.pos, shape = Thema, color = rechtsform)) +
  geom_jitter(alpha = 0.7) +
  scale_color_brewer(palette="Spectral") 

  #scale_y_discrete(breaks = seq(1820, 2022, 10))
ggplot(df, aes(Jahr, volk, color = Thema, size = volkja.proz)) +
    geom_jitter() +
    scale_color_brewer(palette="Spectral") 



df %>% 
  filter(relevant == 1) %>% 
  ggplot(aes(Jahr, volk, color = Thema, size = volkja.proz)) +
    geom_jitter() +
    scale_color_brewer(palette="Spectral") 

df_vis %>% 
  group_by(Jahr, relevant, Thema) %>% 
  count() %>% 
  ggplot(aes(Jahr, n, fill = Thema)) +
  geom_bar(position="stack", stat="identity") +
  scale_fill_brewer(palette="Spectral")

df_vis %>% 
  group_by(Jahrzehnt, Jahr, relevant, Thema) %>% 
  count() %>% 
  ggplot(aes(Jahr, n, color = Thema)) +
  geom_point() +
  facet_wrap(~Jahrzehnt)

df_vis %>% 
  group_by(Jahrzehnt, relevant, Thema) %>% 
  count() %>% 
  ggplot(aes(Jahrzehnt, n, fill = relevant)) +
  geom_bar(position="dodge", stat="identity") 


ggplot(df_vis, aes(Jahr, Thema))+
  geom_col()

ggplot(df, aes(Jahr)) + 
  geom_histogram()



df %>% 
  mutate(Jahrzehnt = as.factor(floor(Jahr/10)*10)) %>%
  group_by(Jahrzehnt, d1e1) %>% 
  count() %>% 
  ggplot(aes(Jahrzehnt, n, fill = d1e1)) + 
  geom_bar(position="dodge", stat="identity") +
  scale_fill_brewer(palette="Spectral")

df %>% 
  select(Jahrzehnt, relevant) %>% 
  group_by(Jahrzehnt, relevant) %>% 
  count() %>% 
  ggplot(aes(Jahrzehnt, n, color = relevant)) + 
  geom_bar(position="dodge", stat="identity") +
  scale_fill_brewer(palette="Spectral")



df %>% 
  select(Jahrzehnt, titel_kurz_d) %>% 
  group_by(Jahrzehnt) %>% 
  count() %>% 
  ggplot(aes(Jahrzehnt, n)) + 
  geom_bar(position="dodge", stat="identity") +
  scale_fill_brewer(palette="Spectral")
Error in `select()`:
! Can't subset columns past the end.
x Column `titel_kurz_d` doesn't exist.
Backtrace:
  1. ... %>% ggplot(aes(Jahrzehnt, n))
  6. dplyr:::select.data.frame(., Jahrzehnt, titel_kurz_d)
  9. tidyselect::eval_select(expr(c(...)), .data)
 10. tidyselect:::eval_select_impl(...)
 19. tidyselect:::vars_select_eval(...)
     ...
 22. tidyselect:::reduce_sels(node, data_mask, context_mask, init = init)
 23. tidyselect:::walk_data_tree(new, data_mask, context_mask)
 24. tidyselect:::as_indices_sel_impl(...)
 25. tidyselect:::as_indices_impl(x, vars, call = call, strict = strict)
 26. tidyselect:::chr_as_locations(x, vars, call = call)
df %>% mutate(Jahrzehnt = as.factor(floor(Jahr/10)*10)) %>%
  select(Jahr, Jahrzehnt, Sicherheitspolitik, Aussenpolitik, Ausländer) %>% 
  group_by(Jahr) %>% 
  ggplot(aes(Jahr)) + 
  geom_histogram() 

NA
NA
NA
df %>% 
  mutate(Jahrzehnt = as.factor(floor(Jahr/10)*10)) %>%
  filter(d1e1|d2e1|d3e1 %in% c("Aussenpolitik", "Sicherheitspolitik", "Sozialpolitik")) %>% 
  group_by(Jahrzehnt, d1e1, d2e1) %>% 
  count() %>% 
  ggplot(aes(Jahrzehnt, n, fill = d1e1)) + 
  geom_col(position="dodge", stat="identity") +
  scale_fill_brewer(palette="Spectral")
‘|’ not meaningful for factorsIgnoring unknown parameters: stat

df %>% 
  mutate(Jahrzehnt = as.factor(floor(Jahr/10)*10)) %>%
  filter(d1e1 %in% c("Aussenpolitik", "Sicherheitspolitik", "Sozialpolitik")) %>% 
  group_by(Jahrzehnt, d1e1, d2e1) %>% 
  count() %>% 
  ggplot(aes(Jahrzehnt, n, fill = d1e1)) + 
  geom_col(position="dodge", stat="identity") +
  scale_fill_brewer(palette="Spectral")
Ignoring unknown parameters: stat

df %>% 
  mutate(Jahrzehnt = as.factor(floor(Jahr/10)*10)) %>%
  filter(d1e1|d2e1|d3e1 %in% c("Aussenpolitik", "Sicherheitspolitik", "Sozialpolitik")) %>% 
  group_by(d1e1, Jahr) %>% 
  count() 
‘|’ not meaningful for factors
# Alter code-chunk
# df_neu <- df_clean %>%
#  filter(d1e3|d2e3|d3e3 %in% themen) %>%
#  select_if(~sum(!is.na(.)) > 0) %>% #nur Spalten wählen, die nicht zu 100% NAs sind
#  rowwise() %>%
#  mutate(alle_kat = list(c(d1e3,  d2e3,  d3e3))) %>%
#  mutate(alle_kat = list(alle_kat[!is.na(alle_kat)])) 
thema_volk <- inner_join(aus_anr, volkja_proz_tab)
Joining, by = "anr"
korrektur <- c(0,0,0,0,0,0,0,100,100,0,0,0,100,0,0,0,0,0,0,0,0,0,0,0,100)
kantone_japroz_korr <- data.frame(kantone_japroz)
kantone_japroz_korr <- bind_cols(kantone_japroz_korr, thema_volk)

for (i in 1:length(kantone_japroz_korr)) {
  kantone_japroz_korr[,i] <- abs(kantone_japroz_korr[,i] -korrektur)
}

kantone_japroz_korr$ju.japroz <- NULL
kantone_japroz_mean <- data.frame(colMeans(kantone_japroz_korr))
kantone_japroz_mean <- kantone_japroz_mean %>% 
  mutate(contra_verschärfung = 100- kantone_japroz_mean$colMeans.kantone_japroz_korr.)

kantone_japroz_mean <- kantone_japroz_mean %>% 
  rename(pro_verschärfung = colMeans.kantone_japroz_korr.)

kantone_japroz_mean["Kantone"] <- rownames(kantone_japroz_mean)

kantone_japroz_mean <- kantone_japroz_mean %>% 
  pivot_longer(
    cols = pro_verschärfung:contra_verschärfung, 
    names_to = "Position", 
    values_to = "Prozent"
)

verschärfung <- ggplot(kantone_japroz_mean, aes(x=reorder(Kantone, Prozent), y=Prozent, fill=Position))+
  geom_bar(position="stack", stat = "identity")+
  theme(axis.text.x = element_text(angle = 90))

ggplotly(verschärfung)
test <- ausländer %>% 
  select(Kurztitel, zhja.proz)
Error in `select()`:
! Can't subset columns past the end.
x Column `zhja.proz` doesn't exist.
Backtrace:
  1. ausländer %>% select(Kurztitel, zhja.proz)
  3. dplyr:::select.data.frame(., Kurztitel, zhja.proz)
  6. tidyselect::eval_select(expr(c(...)), .data)
  7. tidyselect:::eval_select_impl(...)
 16. tidyselect:::vars_select_eval(...)
     ...
 19. tidyselect:::reduce_sels(node, data_mask, context_mask, init = init)
 20. tidyselect:::walk_data_tree(new, data_mask, context_mask)
 21. tidyselect:::as_indices_sel_impl(...)
 22. tidyselect:::as_indices_impl(x, vars, call = call, strict = strict)
 23. tidyselect:::chr_as_locations(x, vars, call = call)
xlsxFile <- "https://www.sem.admin.ch/dam/sem/de/data/publiservice/statistik/asylstatistik/uebersichten/gesuche-nation-ab-1986-d.xlsx.download.xlsx/gesuche-nation-ab-1986-d.xlsx"
as_nation <- read.xlsx(xlsxFile)
as_nation[1,1] <- "Country"
as_nation[1,38] <- "2022"
as.character(as_nation[1, ])
 [1] "Country" "1986"    "1987"    "1988"    "1989"    "1990"    "1991"    "1992"    "1993"    "1994"    "1995"    "1996"    "1997"    "1998"    "1999"    "2000"   
[17] "2001"    "2002"    "2003"    "2004"    "2005"    "2006"    "2007"    "2008"    "2009"    "2010"    "2011"    "2012"    "2013"    "2014"    "2015"    "2016"   
[33] "2017"    "2018"    "2019"    "2020"    "2021"    "2022"   
names(as_nation) <- as_nation[1,]
as_nation <- as_nation[-1,]
total <- as_nation[186,]
as_nation <- as_nation[-186,]
cum_nat <- as_nation %>% 
  pivot_longer(
    cols = "1986":"2022",
    names_to = "Jahr", 
    values_to = "Anzahl"
  )

cum_nat <- transform(cum_nat, Anzahl = as.numeric(Anzahl))

top_land <- aggregate(cum_nat$Anzahl, by=list(Land=cum_nat$Country), FUN=sum)
top_land <- top_land %>% 
  arrange(desc(x)) %>% 
  ungroup()

laender <- as_nation[,1]

top_20 <- top_land %>% 
  mutate(Land=ifelse(Land %in% head(Land, 20), 
                     Land, "Andere"))
top_20 <- aggregate(top_20$x, by=list(Herkunftsland=top_20$Land), FUN=sum)
---
title: "CDA2 Challenge"
output: html_notebook
---


```{r include=FALSE}

#Librarys installieren
library(tidyverse)
library(networkD3)
library(plotly)
library(esquisse)
library(highcharter)
library(openxlsx)
```


```{r}
#Datensatz einlesen
df_original <- read.csv("https://swissvotes.ch/page/dataset/swissvotes_dataset.csv", header=TRUE, sep=";", na = c("NA", "."))
```



```{r}
#Datensatz anschauen
head(df_original)
str(df_original)

```



```{r}
#Variablen definieren um nachher mehrere Spalten gleichzeitig zu mutieren

positionen  <- df_original %>%
  select(ends_with(".pos")|starts_with("p.")|starts_with("pdev")) 

hauptthema <- df_original %>%
  select(d1e1, d2e1 ,d3e1)

unterthema <- df_original %>%
  select(d1e2, d2e2 ,d3e2)

unterunterthema <- df_original %>%
  select(d1e3, d2e3 ,d3e3)

daten <- df_original%>%
  select(datum, starts_with("dat."))

resultate <- df_original %>%
  select(ends_with("annahme")| volk | stand)

parteien <- c(".svp", ".fdp", ".sp", ".cvp", ".gsp", ".sps")

```


```{r}
#Data-Wrangling (Variablen codieren)
data <- df_original %>%
  # filter((d1e2 > 2 & d1e2 < 4 | (d1e3 > 10.30 & d1e3 < 10.33)) |
  #        (d2e2 > 2 & d2e2 < 4 | (d2e3 > 10.30 & d2e3 < 10.33))|
  #        (d3e2 > 2 & d3e2 < 4 | (d3e3 > 10.30 & d3e3 < 10.33)) ) %>% #Filter der Themengebiete
  select(-(ends_with(".fr")|ends_with("_f")|ends_with(".en")))%>% #Entfernung französische Übersetzungen
  rename(Kurztitel = titel_kurz_d, Titel = titel_off_d, ) %>% 

    mutate(rechtsform = factor(case_when(
    rechtsform == 1 ~ "Obligatorisches Referendum",
    rechtsform == 2 ~ "Fakultatives Referendum",
    rechtsform == 3 ~ "Volksinitiative",
    rechtsform == 4 ~ "Gegenentwurf zu Volksinitiative",
    rechtsform == 5 ~ "Stichfrage")))%>% 
  
    mutate(dep = factor(case_when(
    dep == 1 ~ "EDA",
    dep == 2 ~ "EDI",
    dep == 3 ~ "EJPD",
    dep == 4 ~ "VBS",
    dep == 5 ~ "EFD",
    dep == 6 ~ "WBF",
    dep == 7 ~ "UVEK",
    dep == 8 ~ "BK")))%>%
  mutate (Jahr = as.integer(format(as.Date(datum, format='%d.%m.%Y'), format="%Y"))) %>% 
  
  mutate(across(names(positionen), 
           ~ factor(case_when(. == 1 ~ "Befürwortend",
    .== 2 ~"Ablehnend",
    .== 3 ~"Keine",
    .== 4 ~"Leere Abgabe",
    .== 5 ~"Stimmfreigabe",
    .== 8 ~"Vorzug für den Gegenentwurf",
    .== 9 ~"Vorzug für Volksinitiative",
    . == 66 ~"keine",
    . == 9999 ~"Partei ex. nicht",)))) %>%
  
  mutate(across(names(hauptthema), 
             ~ factor(case_when(. == 1 ~ "Staatsordnung",
    .== 2 ~ "Aussenpolitik",
    .== 3 ~"Sicherheitspolitik",
    .== 4 ~"Wirtschaft",
    .== 5 ~"Landwirtschaft",
    .== 6 ~"Öffentliche Finanzen",
    .== 7 ~"Energie",
    .== 8 ~"Verkehr und Infrastruktur",
    .== 9 ~"Umwelt und Lebensraum",
    .== 10 ~"Sozialpolitik",
    .== 11 ~"Bildung und Forschung",
    .== 12 ~"Kultur, Religion, Medien",))))%>%
  
  mutate(across(names(unterthema), 
             ~ factor(case_when(. == 2.1 ~ "Aussenpolitische Grundhaltung",
    .== 2.2 ~ "Europapolitik",
    .== 2.3 ~ "Internationale Organisationen",
    .== 2.4 ~ "Entwicklungszusammenarbeit",
    .== 2.5 ~ "Staatsverträge mit einzelnen Staaten",
    .== 2.6 ~"Aussenwirtschaftspolitik",
    .== 2.7 ~"Diplomatie",
    .== 2.8 ~"Auslandschweizer:innen",
    .== 3.1 ~"Öffentliche Sicherheit",
    .== 3.2 ~"Armee",
    .== 3.3 ~"Landesversorgung",
    .== 10.3 ~"Ausländer & Flüchtlinge", 
    TRUE ~"andere")))) %>%
  mutate(across(names(unterunterthema), 
             ~ factor(case_when(. == 10.31 ~ "Ausländerpolitik",
    .== 10.32 ~ "Flüchtlinge",
     TRUE ~"andere")))) %>%
  
  mutate(across(names(daten), 
                ~ as.Date(., "%d.%m.%Y"))) %>%
  
  mutate(across(names(resultate), 
                ~ factor(case_when(. == 0 ~"abgelehnt", 
                .== 1 ~ "angenommen", 
                .== 3 ~ "Ständemehr nicht nötig", 
                .== 8 ~ "Gegenentwurf angenommen", 
                .== 9 ~ "Volksinitiative angenommen" )))) %>% 
  mutate(anr = as.factor(anr)) 
  

  
```


```{r} 
#Neue Variablen generieren & Datensatz selektieren

data$bet_volkja.proz <- (data$bet*(data$volkja.proz/100))

df <- data %>%
  select(anr,Jahr, Kurztitel, rechtsform, annahme, bet_volkja.proz, bet,  d1e1:br.pos, bv.pos:nr.pos, sr.pos, unter_g, unter_u, ends_with(parteien), ja.lager, nein.lager, volk:stand, volkja.proz, ktjaproz,matches("...bet"),matches("...japroz"), matches("...annahme"),swissvoteslink, anneepolitique, info_br.de, info_dep.de, info_amt.de)


#neue Variablen: prüfen, ob Thema vorkommt und wenn ja, trägt es 1 ein (sonst 0)
df$Sicherheitspolitik <- +(rowSums(df[2:12] == 'Sicherheitspolitik', na.rm = TRUE) > 0)
df$Aussenpolitik <- +(rowSums(df[2:12] == 'Aussenpolitik', na.rm = TRUE) > 0)
df$Ausländer <- +(rowSums(df[2:12] == 'Ausländerpolitik', na.rm = TRUE) > 0)
df$Flüchtlinge <- +(rowSums(df[2:12] == 'Flüchtlinge', na.rm = TRUE) > 0)

#neue Spalte: fasst Themen der neuen Spalten zusammen, alles andere wird als "anderes" kategorisiert. 
df <- df %>% 
    mutate(Thema = factor(case_when(
    Sicherheitspolitik == 1 ~ "Sicherheitspolitik",
    Aussenpolitik == 1 ~ "Aussenpolitik",
    Flüchtlinge == 1 ~ "Flüchtlinge",
    Ausländer == 1 ~ "Ausländer",
    TRUE ~"andere"))) %>% 
    mutate(Jahrzehnt = as.factor(floor(Jahr/10)*10)) %>% 
    mutate(relevant = ifelse(Thema == "andere", "nein", "ja")) 

```


```{r} 
ausländer <- df %>% 
  filter(Thema %in% c("Ausländer", "Flüchtlinge")) %>%
  filter(rechtsform != "Stichfrage") %>% 
  mutate (Faktor = c(0, 0, 0, 0, 0, 0, 0, -100, -100, 0, 0, 0, -100, 0, 0, 0, 0, 0, 0,  0, 0, 0, 0, 0, -100 )) %>% 
  mutate(volkja.proz = abs(volkja.proz+Faktor))


#x <- ausländer %>% 
#  select(ends_with("proz")) %>% 
 # mutate(lapply(., ~ .+Faktor))
  
#lapply(x, +ausländer$Faktor)
#x

#Durchschnitt allg. Schweiz bei Abstimmungen vs. Abstimmungen über Ausländer
mean(df$bet, na.rm = TRUE)
mean(ausländer$bet)





kantone_bet <- ausländer %>%
  select(ends_with(".bet")) %>% 
  summarize(mean = colMeans(., na.rm = TRUE))

kantone_japroz <- ausländer %>% 
  select(ends_with(".japroz"))

Liste_kantone <- list(names(colMeans(ausländer[39:64])))
```


```{r} 
svp_ja <- ausländer %>% 
  filter(p.svp == "Befürwortend") %>% 
  summarize(Durchschnitt = colMeans(ausländer[39:64], na.rm = TRUE))



svp_nein <- ausländer %>% 
  filter(p.svp == "Ablehnend") %>% 
  summarise_at(c(names(kantone_japroz)), mean, na.rm = TRUE)


svp_total <- ausländer %>% 
  group_by(p.svp) %>% 
  summarise_at(c(names(kantone_japroz)), mean, na.rm = TRUE)


ggplot(svp_total, aes(p.svp, zh.japroz))+
  geom_jitter()

SVP_kt <- cbind(argh = Liste_kantone, svp_ja, svp_nein) 

colnames(SVP_kt)[1] <- "Kanton"


mean(df$volkja.proz, na.rm = TRUE)

annahmen_ausländer <- ausländer %>% 
  group_by(rechtsform) %>% 
  summarize(mean = mean(volkja.proz, na.rm = TRUE))
mean(ausländer$volkja.proz)


parteien_japroz <- ausländer %>% 
  group_by(p.svp, p.fdp, p.sps, p.cvp) %>% 
  summarize(jastimmen = mean(volkja.proz))
  
ggplot(ausländer, aes(Jahr)) + 
  geom_histogram(binwidth = 5)




ausländer[39:61]


#colMeans(ausländer["zh.bet":"ge.bet"], na.rm = TRUE)
ggplot(ausländer, aes(Jahrzehnt, fill = Thema)) + 
  geom_bar()

flüchtling <- df %>% 
  filter(Thema == "Flüchtlinge") 


#Stimmbeteiligung Kantone im Vergleich für Abstimmungen
ggplot(ausländer, aes(anr, bet, fill= annahme))+
  geom_col()

#glimpse(df)
```



```{r} 
#eingeschränkter Datensatz für Visualisierung
df_vis <- df %>% 
  select(anr, Jahr, Kurztitel, rechtsform, br.pos, Sicherheitspolitik:relevant) 

```


```{r} 
#Anzahl Abstimmungen, gruppiert nach Jahrzehnt & Thema, nebeneinander
df_vis %>% 
  group_by(Jahrzehnt, Thema) %>% 
  count() %>% 
  ggplot(aes(Jahrzehnt, n, fill = Thema)) +
  geom_bar(position="dodge", stat="identity") +
  scale_fill_brewer(palette="Spectral")

#Anzahl Abstimmungen, gruppiert nach Jahrzehnt & Thema, stacked
df_vis %>% 
  group_by(Jahrzehnt, relevant, Thema) %>% 
  count() %>% 
  ggplot(aes(Jahrzehnt, n, fill = Thema)) +
  geom_bar(position="stack", stat="identity") +
  scale_fill_brewer(palette="Spectral") +
  labs(title = "Anzahl Abstimmungen pro Jahrzehnt", subtitle =  "Gruppiert nach Themen unseres Beitrages & Rest", y = "Anzahl")




df_vis %>% 
  filter(Thema == "Ausländer"|Thema == "Flüchtlinge") %>% 
  group_by(Jahrzehnt, relevant, Thema) %>% 
  count() %>% 
  ggplot(aes(Jahrzehnt, n, fill = Thema)) +
  geom_bar(position="dodge", stat="identity") +
  scale_fill_brewer(palette="Spectral") +
  labs(title = "Anzahl Abstimmungen pro Jahrzehnt", subtitle =  "Gruppiert nach Themen unseres Beitrages & Rest", y = "Anzahl")


df %>% 
  filter(Thema == "Ausländer"|Thema == "Flüchtlinge") %>% 
  group_by(Jahrzehnt, Thema, annahme) %>% 
  count() %>% 
  ggplot(aes(Jahrzehnt, n, fill = annahme)) +
  geom_bar(position="stack", stat="identity") +
  #scale_fill_brewer(palette="Spectral") +
  labs(title = "Anzahl Abstimmungen zu Flüchtlinge / Ausländer", subtitle =  "Angenommene & abgelehnte", y = "Anzahl")

```


```{r} 
#Abstimmungen, gruppiert nach Rechtsform & Jahrzehnt
df %>% 
  filter(relevant == "ja") %>% 
  group_by(Jahrzehnt, rechtsform, Thema,annahme) %>% 
  count() %>% 
  ggplot(aes(Jahrzehnt, rechtsform, color = annahme)) +
  geom_jitter() +
  #scale_color_brewer(palette="Spectral") +
  facet_wrap(~Thema)

```


```{r} 
#Anzahl Abstimmungen pro Jahrzehnt in Zahlen (nur relevante Themen)
df %>% 
  filter(Jahr > 1910, relevant == "ja") %>% 
  group_by(Jahrzehnt, Thema) %>% 
  count()

#Anzahl Abstimmungen pro Rechtsform + Position Bundesrat in Zahlen (nur relevante Themen)
df_vis %>% 
  filter(Jahr > 1910, relevant == "ja") %>% 
  group_by(rechtsform, Thema, br.pos) %>% 
  count()


ausländer <- df %>% 
  filter(Thema == "Ausländer")

flucht <- df %>% 
  filter(Thema == "Flüchtlinge")

  
```


```{r} 

positionen_br <- ggplot(df, aes( Jahr,rechtsform, color = br.pos )) + geom_jitter() + scale_color_brewer(palette="Spectral") 

positionen_br

ggplot(df, aes(Jahr, br.pos, color = Thema, shape = rechtsform)) +
  geom_jitter(alpha = 0.7) +
  scale_color_brewer(palette="Spectral") 
  #scale_y_discrete(breaks = seq(1820, 2022, 10))

  df %>% 
  filter(relevant == "ja") %>% 
  ggplot(aes(br.pos, Thema, color = rechtsform), na.rm = TRUE) +
  geom_jitter(alpha = 0.7)   +
  scale_color_brewer(palette="Spectral") 
  #scale_y_discrete(breaks = seq(1820, 2022, 10))
  
  
  df %>% 
  filter(relevant == "ja") %>% 
  ggplot(aes(Thema, rechtsform, color = br.pos)) +
  geom_jitter() 
  #scale_color_brewer(palette="Spectral") 
  #scale_y_discrete(breaks = seq(1820, 2022, 10))
  
  
  df %>% 
  filter(relevant == "ja") %>% 
  ggplot(aes(Jahr, br.pos, shape = Thema, color = rechtsform)) +
  geom_jitter(alpha = 0.7) +
  scale_color_brewer(palette="Spectral") 
  #scale_y_discrete(breaks = seq(1820, 2022, 10))
```


```{r} 
ggplot(df, aes(Jahr, volk, color = Thema, size = volkja.proz)) +
    geom_jitter() +
    scale_color_brewer(palette="Spectral") 


df %>% 
  filter(relevant == 1) %>% 
  ggplot(aes(Jahr, volk, color = Thema, size = volkja.proz)) +
    geom_jitter() +
    scale_color_brewer(palette="Spectral") 

```


```{r} 
df_vis %>% 
  group_by(Jahr, relevant, Thema) %>% 
  count() %>% 
  ggplot(aes(Jahr, n, fill = Thema)) +
  geom_bar(position="stack", stat="identity") +
  scale_fill_brewer(palette="Spectral")
```


```{r}
df_vis %>% 
  group_by(Jahrzehnt, Jahr, relevant, Thema) %>% 
  count() %>% 
  ggplot(aes(Jahr, n, color = Thema)) +
  geom_point() +
  facet_wrap(~Jahrzehnt)

```


```{r} 
df_vis %>% 
  group_by(Jahrzehnt, relevant, Thema) %>% 
  count() %>% 
  ggplot(aes(Jahrzehnt, n, fill = relevant)) +
  geom_bar(position="dodge", stat="identity") 

ggplot(df_vis, aes(Jahr, Thema))+
  geom_col()

```


```{r eval=FALSE, include=FALSE}
#Visualisierungen
media <- ausländer %>%
  select(Kurztitel, rechtsform, mediaton.d, mediaton.f, mediaton.tot) 

ggplot(media, aes(rechtsform, mediaton.tot, na.rm = TRUE)) +
  geom_boxplot()

ggplot(media, aes(Titel, mediaton.d, mediaton.f)) +
  geom_jitter() 

pos <- data_cda %>%
  select(Titel, names(positionen))
```


```{r}
ggplot(df, aes(Jahr)) + 
  geom_histogram()


df %>% 
  mutate(Jahrzehnt = as.factor(floor(Jahr/10)*10)) %>%
  group_by(Jahrzehnt, d1e1) %>% 
  count() %>% 
  ggplot(aes(Jahrzehnt, n, fill = d1e1)) + 
  geom_bar(position="dodge", stat="identity") +
  scale_fill_brewer(palette="Spectral")
```


```{r}
df %>% 
  select(Jahrzehnt, relevant) %>% 
  group_by(Jahrzehnt, relevant) %>% 
  count() %>% 
  ggplot(aes(Jahrzehnt, n, color = relevant)) + 
  geom_bar(position="dodge", stat="identity") +
  scale_fill_brewer(palette="Spectral")


df %>% 
  select(Jahrzehnt, titel_kurz_d) %>% 
  group_by(Jahrzehnt) %>% 
  count() %>% 
  ggplot(aes(Jahrzehnt, n)) + 
  geom_bar(position="dodge", stat="identity") +
  scale_fill_brewer(palette="Spectral")
```


```{r}
df %>% mutate(Jahrzehnt = as.factor(floor(Jahr/10)*10)) %>%
  select(Jahr, Jahrzehnt, Sicherheitspolitik, Aussenpolitik, Ausländer) %>% 
  group_by(Jahr) %>% 
  ggplot(aes(Jahr)) + 
  geom_histogram() 



```


```{r}
df %>% 
  mutate(Jahrzehnt = as.factor(floor(Jahr/10)*10)) %>%
  filter(d1e1|d2e1|d3e1 %in% c("Aussenpolitik", "Sicherheitspolitik", "Sozialpolitik")) %>% 
  group_by(Jahrzehnt, d1e1, d2e1) %>% 
  count() %>% 
  ggplot(aes(Jahrzehnt, n, fill = d1e1)) + 
  geom_col(position="dodge", stat="identity") +
  scale_fill_brewer(palette="Spectral")




df %>% 
  mutate(Jahrzehnt = as.factor(floor(Jahr/10)*10)) %>%
  filter(d1e1 %in% c("Aussenpolitik", "Sicherheitspolitik", "Sozialpolitik")) %>% 
  group_by(Jahrzehnt, d1e1, d2e1) %>% 
  count() %>% 
  ggplot(aes(Jahrzehnt, n, fill = d1e1)) + 
  geom_col(position="dodge", stat="identity") +
  scale_fill_brewer(palette="Spectral")

```


```{r}
df %>% 
  mutate(Jahrzehnt = as.factor(floor(Jahr/10)*10)) %>%
  filter(d1e1|d2e1|d3e1 %in% c("Aussenpolitik", "Sicherheitspolitik", "Sozialpolitik")) %>% 
  group_by(d1e1, Jahr) %>% 
  count() 



```

```{r eval=FALSE, include=FALSE}
#Sankey
d <- df %>% 
  filter(rechtsform != "Stichfrage", relevant == "ja") %>% 
  select(Thema, rechtsform, bv.pos,  annahme)


hchart(data_to_sankey(d), "sankey", name = "Resultat")


d2 <- df %>% 
  filter(rechtsform != "Stichfrage", relevant == "ja") %>% 
  select(Thema, rechtsform,  p.svp, annahme) %>% 
  drop_na(.)


hchart(data_to_sankey(d2), "sankey", name = "Resultat")


d4 <- df %>% 
  filter(rechtsform != "Stichfrage", Thema == "Ausländer") %>% 
  select(Thema, rechtsform,  bv.pos, annahme) %>% 
  drop_na(.)


hchart(data_to_sankey(d4), "sankey", name = "Resultat")



d3 <- df %>% 
  filter(rechtsform != "Stichfrage") %>% 
  select(rechtsform, br.pos, volk, stand,  annahme) %>% 
  mutate(volk = case_when(volk == "angenommen"~ "Annahme Volk",
                             volk == "abgelehnt"~ "Ablehnung Volk")) %>% 
  mutate(stand = case_when(stand == "angenommen"~ "Annahme Stände",
                           stand == "abgelehnt"~ "Ablehnung Stände",
                           stand == "Ständemehr nicht nötig" ~ "Ständemehr nicht nötig")) %>% 
  drop_na(.)


(pl <- hchart(data_to_sankey(d3), "sankey", name = "Resultat", width =  5)) 
pl <- pl %>% hc_title(text = "Zusammenhang zwischen Position des Bundesrats und Resultat der Abstimmung") %>% 
  hc_size(height = 500, width = 600)

htmlwidgets::saveWidget(widget = pl, file = "C:/Users/Antonia/test.html")


```

```{r}
# Alter code-chunk
# df_neu <- df_clean %>%
#  filter(d1e3|d2e3|d3e3 %in% themen) %>%
#  select_if(~sum(!is.na(.)) > 0) %>% #nur Spalten wählen, die nicht zu 100% NAs sind
#  rowwise() %>%
#  mutate(alle_kat = list(c(d1e3,  d2e3,  d3e3))) %>%
#  mutate(alle_kat = list(alle_kat[!is.na(alle_kat)])) 
```

```{r}

volkja_proz_tab <- select(df,anr, volkja.proz)

aus_anr <- select(ausländer, anr)
aus_anr = aus_anr[aus_anr['anr'] != "552.3"]
aus_anr <- as.data.frame(aus_anr) %>% 
  rename(anr=aus_anr)
#flu_anr <- select(flüchtling, anr)
#anr_tot <- bind_rows(aus_anr, flu_anr) 
#anr_tot <- transform(anr_tot, anr = as.numeric(anr))
#anr_tot <- arrange(anr_tot, anr)

#volkja_proz_tab <- transform(volkja_proz_tab, anr = as.numeric(anr))

thema_volk <- inner_join(aus_anr, volkja_proz_tab)
thema_volk$anr <- NULL

#thema_volk$anr <- NULL

#bind_cols(thema_volk, kantone_japroz_korr)
```


```{r}
korrektur <- c(0,0,0,0,0,0,0,100,100,0,0,0,100,0,0,0,0,0,0,0,0,0,0,0,100)
kantone_japroz_korr <- data.frame(kantone_japroz)
kantone_japroz_korr <- bind_cols(kantone_japroz_korr, thema_volk)

for (i in 1:length(kantone_japroz_korr)) {
  kantone_japroz_korr[,i] <- abs(kantone_japroz_korr[,i] -korrektur)
}

kantone_japroz_korr$ju.japroz <- NULL
kantone_japroz_mean <- data.frame(colMeans(kantone_japroz_korr))
kantone_japroz_mean <- kantone_japroz_mean %>% 
  mutate(contra_verschärfung = 100- kantone_japroz_mean$colMeans.kantone_japroz_korr.)

kantone_japroz_mean <- kantone_japroz_mean %>% 
  rename(pro_verschärfung = colMeans.kantone_japroz_korr.)

kantone_japroz_mean["Kantone"] <- rownames(kantone_japroz_mean)

kantone_japroz_mean <- kantone_japroz_mean %>% 
  pivot_longer(
    cols = pro_verschärfung:contra_verschärfung, 
    names_to = "Position", 
    values_to = "Prozent"
)

verschärfung <- ggplot(kantone_japroz_mean, aes(x=reorder(Kantone, Prozent), y=Prozent, fill=Position))+
  geom_bar(position="stack", stat = "identity")+
  theme(axis.text.x = element_text(angle = 90))

ggplotly(verschärfung)
```


```{r}
test <- ausländer %>% 
  select(Kurztitel, zhja.proz)




```

```{r}
xlsxFile <- "https://www.sem.admin.ch/dam/sem/de/data/publiservice/statistik/asylstatistik/uebersichten/gesuche-nation-ab-1986-d.xlsx.download.xlsx/gesuche-nation-ab-1986-d.xlsx"
as_nation <- read.xlsx(xlsxFile)
as_nation[1,1] <- "Country"
as_nation[1,38] <- "2022"
as.character(as_nation[1, ])
names(as_nation) <- as_nation[1,]
as_nation <- as_nation[-1,]
total <- as_nation[186,]
as_nation <- as_nation[-186,]

```

```{r}
cum_nat <- as_nation %>% 
  pivot_longer(
    cols = "1986":"2022",
    names_to = "Jahr", 
    values_to = "Anzahl"
  )

cum_nat <- transform(cum_nat, Anzahl = as.numeric(Anzahl))

top_land <- aggregate(cum_nat$Anzahl, by=list(Land=cum_nat$Country), FUN=sum)
top_land <- top_land %>% 
  arrange(desc(x)) %>% 
  ungroup()

laender <- as_nation[,1]

top_20 <- top_land %>% 
  mutate(Land=ifelse(Land %in% head(Land, 20), 
                     Land, "Andere"))
top_20 <- aggregate(top_20$x, by=list(Herkunftsland=top_20$Land), FUN=sum)
```


```{r eval=FALSE, include=FALSE}

as_nation[2:38] <- sapply(as_nation[2:38],as.numeric)
sapply(as_nation, class)

cum_nat <- transform(cum_nat, Anzahl = as.numeric(Anzahl))



top_land <- aggregate(cum_nat$Anzahl, by=list(Land=cum_nat$Country), FUN=sum)
top_land <- top_land %>% 
  arrange(desc(x)) %>% 
  ungroup()

laender <- as_nation[,1]

top_20 <- top_land %>% 
  mutate(Land=ifelse(Land %in% head(Land, 20), 
                     Land, "Andere"))
top_20 <- aggregate(top_20$x, by=list(Herkunftsland=top_20$Land), FUN=sum)
#ggplot(cum_nat, aes(x=Jahr, y=Anzahl, fill=Country))+
 # geom_area()
```
